CONTROLE OPTIMALE PAR MAGNETOCOUPLEURS |
CONTENU : Mis à jour 8 février 1999, revu avril 2012 I Présentation générale du problème |
|
Cette
étude présente des considérations générales relatives à la commande optimale et
naturellement des remarques et application spécifiques au projet en cours.
L'auteur rédacteur de la page, n'est pas le spécialiste qui a mis au point ces
lignes. L'auteur s'est contacté de la présentartion pédagogique, en pensant
qu'il doit comprendre et expliquer ce qu'il écrit.
Envisageons
par exemple le cas d'un micro satellite, stabilisé par gradient de gravité et
des magnétocoupleurs,
interagissant avec le champ magnétique terrestre B(t) existant à l'endroit où
se trouve le satellite à l'instant t.
La stabilisation des oscillations autour d'une attitude choisie, consiste à générer dans le
satellite, un moment magnétique M
( vecteur à 3 composantes ) de matrice
M
= (Mx My Mz)T
Ceci
par une électronique appropriée, pilotée par des capteurs et une informatique
de traitement des mesures et de génération de la commande (problème de bruits, filtrage
de Kalman pour le calcul de l'estimation des mesures des angles et des vitesses
angulaires, commande par matrice de contre-réaction). Des courants adéquats
sont alors générés et envoyés dans des bobines pour créer M.
Le
satellite est alors piloté et stabilisé grâce à un couple de commande Mc, résultant
de l'interaction entre le moment magnétique et le champ magnétique
terrestre local, pour générer un couple mécanique Mc. Voir la page sur les magnétocoupleurs
A
la base de cette automatique, il y a le fameux vecteur m dit de commande m = (mx my mz)T qui dans la page citée ci-dessus
est en loi proportionnelle dérivée sur les 3 axes.
Tous
calculs effectués, on obtient alors
défini la relation
Mc = S m
(
ATTENTION POUR LA SUITE : conformément aux notations classiques de la
représentation d'état des systèmes m désigne
l'entrée U du système satellite+magnétocoupleurs).
La matrice S est fonction du temps par
l'intermédiaire du champ magnétique terrestre, mais également des angles de
roulis, lacet, tangage, car ce sont les composantes de B dans le référentiel
satellite qui sont utilisées.
A
la fin de ce chapitre, on verra comment on peut avec une excellente
approximation, résoudre, malgré la présence des angles, le problème de la
commande optimale.
Voici
donc la forme des équations générales adaptées au cas particulier des
magnétocoupleurs, sous forme d'équation d'état.
correspondant
au diagramme fonctionnel suivant :
B désigne ici la matrice d'entrée du
satellite et non le champ magnétique terrestre.
On
supposera que Y = X soit C = I et D* = 0.
Dans
le cas du satellite A et B sont des matrices invariantes, à la différence de
B*=BS qui dépend de la matrice variante S(t).
II PROBLEME DE LA COMMANDE
OPTIMALE :
1°) Que signifie commande optimale?
On
souhaite piloter (grâce à la commande U) le système de manière à ce qu'il
satisfasse de la meilleure façon possible des spécifications portant sur le
vecteur d'état et la consommation énergétique, au sens d'un certain critère à
formuler de manière explicite.
2°) Quel critère?
Par
exemple, pour notre micro-satellite suite à une perturbation ou sous l'effet de
perturbations toujours présentes, on désire un retour à la position pointage
Terre le plus rapide possible, avec le plus de précision possible, une
consommation minimale d'énergie et une stabilisation durable.
Il
nous faudra donc exprimer cette idée et naturellement accepter peut-être de
privilégier la précision au détriment de la consommation d'énergie ou le
contraire suivant les spécifications de la mission et le coût maximum des
équipements. En un sens il nous faudra pondérer les qualités souhaitées.
3°) Comment quantifier les qualités précédentes?
Les
théoriciens de l'automatique mathématique ont montré que si l'on exprime le critère
sous la forme de la minimisation d'une expression quadratique du vecteur d'état
X et de la command U, le problème peut se traduire mathématiquement et admet
une solution analytique.
Dans
le cas des systèmes linéaires (ou linéarisés autour d'un point de
fonctionnement comme pour le satellite petits angles), la solution s'exprime en
faisant apparaître que la commande optimale dépend linéairement du vecteur d'état
[ U*(t)=-K(t)X(t) ]
a) Comment traduire la convergence vers un état final souhaité?
Donnons-nous
une position finale idéale sous la forme d'un vecteur connu, l(t1), où t1 est
l'instant final.
Dans
le cas du satellite qui nous intéresse le vecteur d'état X représente les
angles de dépointage et les vitesses angulaires. La valeur finale souhaitée est
alors nulle à l'instant t1.
On
introduit alors une MATRICE M DE PONDERATION symétrique réelle,
semi-définie positive et on pose la fonctionnelle à minimiser:
Suivant
la grandeur des coefficients de M, on pourra donc demander plus de précision
sur tel ou tel angle ou vitesse angulaire, en augmentant le facteur de
pondération.
En
clair et intuitivement, un grand coefficient ne peut supporter d'être multiplié
par une quantité importante, d'autant plus que dans un critère quadratique
c'est le carré de la quantité qui intervient.
Par
exemple ci-après les coefficient M11 et M22 sont
prépondérants désignant le critère comme devant apporter de la précision sur
l'angle de roulis et la vitesse de roulis, au détriment des autres angles ou
vitesses angulaires.
b) Comment traduire que le vecteur d'état du système soit aussi
proche que possible d'une solution prédéterminée l(t)?
Cette
qualité du système peut être appréhendée par la somme des écarts entre le
vecteur d'état et la solution idéale tout au long du temps, avec de toute
évidence une approche asymptotique quand le temps augmente indéfiniment, pour
assurer la convergence de l'intégrale.
La
matrice de pondération Q symétrique réelle, définie positive peut, par la grandeur
relative de ses coefficients, favoriser la précision d'un paramètre particulier
au détriment des autres.
c) Comment traduire la consommation d'énergie?
Il
y a de fortes chances pour que le vecteur de commande U soit directement lié à
la consommation globale . Minimiser l'énergie de la commande permettra de
minimiser l'énergie globale.
Tout
au long de l'évolution du système, il nous faut donc sommer l'énergie consommée
ce qui se fait par l'intermédiaire de la quantité:
avec
les mêmes remarques que précédemment sur la matrice R définie positive et la
pondération de R.
Conclusion: formulation générale du critère:
La commande est dite optimale si l'évolution du système a lieu en
minimisant J.
Le
choix des matrices M, Q, R est une affaire d'expérience et de sens physique.
III RESOLUTION DU PROBLEME DE LA COMMANDE OPTIMALE
EXPRIMEE DANS LE CAS DU SATELLITE :
1°) Formulation mathématique du problème :
On
veut stabiliser le satellite par un RETOUR D'ETAT , où la
matrice K des 18 gains s'écrit:
Par
exemple le moment magnétique de la bobine placée sur l'axe x vaut durant la commande:
Les
coefficients à 2 indices désignent les couplages. Telle est la commande la plus
générale.
Cette
matrice K est fonction du temps si les matrices A et B* sont variantes. On
mesure alors la complexité du problème.
Le
schéma - bloc du système est le suivant:
Comment déterminer la MATRICE DE GAIN K réalisant la commande optimale
c'est à dire minimisant la fonctionnelle J ? La réponse est donnée en 2°
2°) Principe du minimum de
PONTRYAGUINE :
Limitons
le théorème au cas particulier qui nous occupe et dans lequel, il est souhaité
un retour vers 0 du vecteur d'état. Ainsi l
(t1) = 0
On
rappelle aussi que B* = B(t) S(t) , que le vecteur de sortie et d'observation
est Y = X, la matrice D est donc ici nulle et C = I matrice identité d'ordre 6.
Indiquons
tout de même que sur le plan théorique nous avons les équations traduisant le
principe du minimum de H:
On
retrouve la forme classique des équations écrites avec un hamiltonien et des
variables conjuguées.
THEOREME La
recherche de la commande optimale U = - KX , donc de la matrice de
gain K, d'un système à équation d'état ( dite équation de contrainte ) et variable de sortie Y telle que , minimisant le critère
quadratique J est
équivalente à la recherche du minimum (dit Principe du minimum de
Pontryaguine) qui consiste à traduire le minimum de la fonction H appelée
HAMILTONIEN associé au problème. µ
s'appelle le multiplicateur indéterminé de Lagrange associé à la contrainte |
Il n'est pas question de démontrer ici ce théorème, ni même
le résultat fondamental qui suit. Ce résultat est directement utilisable dans
tous les cas où les matrices A et B ne dépendent que du temps.
RESULTAT PRATIQUE CAPITAL ET UTILISABLE: La
matrice de gain K solution de la commande optimale est donnée par: où
P vérifie une équation dite de Ricatti: complètement
définie par la condition au temps final t1: |
1°) Calcul de P connaissant A, B, S, R, Q, M.:
Le
résultat ci-dessus appelle la remarque suivante: la condition au temps t1
joue le rôle d'une condition initiale, il faut donc intégrer l'équation à
"rebours".
Ce
qui signifie qu'en pratique on posera une nouvelle variable t = t1-t
appelée temps restant et qu'on intégrera l'équation
On
achèvera par |
Le
Cdt Godard, qui a posé et résolu le problème théorique, a eu des idées et
réflexions décisives en remarquant que :
o
Kalman
a démontré mathématiquement que, lorsque le temps d'observation t1 était grand,
et les matrices A et B invariantes, la matrice de Ricatti P était constante sur
la majeure partie de la durée du processus.
L'influence
réelle de l'erreur terminale représentée par la matrice M n'apparaît donc qu'à
la fin du processus.
En
outre la théorie de la commande optimale linéaire quadratique suppose que les
matrices A et B* = BS ne dépendent pas d'autres variables que le temps. Ce qui
n'est pas le cas ici puisque S dépend aussi des angles du satellite,
nécessaires au calcul de la projection du champ magnétique du repère orbital
vers le repère satellite.
o
Puisque
le SCAO ne fonctionne qu'aux petits angles ( fonctionnement nominal en
régulation autour de X=0 ), l'hypothèse simplificatrice qui consiste à dire que
le champ magnétique est le même en axes orbitaux et en axes satellites, permet
de s'affranchir de la contrainte de dépendance par rapport aux angles.
S
devient alors déterministe du temps ( comme le champ magnétique vu du repère
orbital ). Le calcul préalable de P(t) donc de K(t) devient alors possible avec
comme valeur de S:
o
Le
champ magnétique terrestre est une fonction vectorielle périodique du temps
dans le repère orbital, de période égale à la période orbitale T du satellite.
En
supposant t1 grand pour s'affranchir de l'influence de M, on obtiendra non pas
une solution constante pour P mais une solution périodique de période T.
En
prenant ainsi t1 = 3T par exemple, si la résolution de l'équation de Ricatti
montre que P(t) est bien périodique sur les 2 premières périodes, on pourra
utiliser les 2 résultats pratiques fondamentaux suivants:
o 1 La matrice K est périodique de
période T. Il suffit donc de mémoriser cette matrice dans une mémoire et y
chercher les valeurs adéquates des gains en fonction de la position du
satellite sur l'orbite et non du temps.
o 2 la commande ne dépend plus du
temps t1 qui peut être repoussé à l'infini. ( en fait durée de vie du
satellite). Cette commande donc s'applique en permanence et elle est d'autant
plus efficace que les angles sont petits.
Il
faut être conscient que cette commande optimale est approximative si les angles
satellite ne sont pas négligeables, ce qui peut être le cas dans les conditions
initiales après la mise en orbite en phase d'acquisition.
On
réalisera alors la simulation du SCAO du satellite avec la matrice K calculée
en 1°.
Naturellement,
il faut prendre dans cette simulation, la matrice S(t,f,y,q) exacte donnée à la page 1.
On
recommencera autant de fois que nécessaire, avec des pondérations différentes
des matrices M, Q, R, jusqu'à obtenir des résultats satisfaisants au regard des
spécifications imposées à la mission.
Nous
pouvons affirmer, pour les avoir testés, que les résultats sur K(t) sont très
sensibles à des variations du simple au double des coefficients de pondération
dans M, Q, R.
Il
est conseillé dans ce problème de prendre R=I et de jouer surtout sur la
grandeur relative des coefficients de Q par rapport à ceux de R. La matrice M
que nous avons toujours prise égale à Q ne joue pas vraiment un grand rôle
quand le temps final t1 est grand
On
fera une mise au point définitive du SCAO en simplifiant éventuellement la
commande , après avoir constaté que des gains trop petits ne jouent aucun rôle.
Les simulations valideront alors ces hypothèses simplificatrices.
En
fin d'étude on choisira les magnétocoupleurs qui satisfont physiquement aux
spécifications de la mission, et qui supportent les gains calculés précédemment
( choix du moment magnétique maximum ).
Remarque finale :
il serait intéressant de tester et éventuellement valider une commande optimale
sur un micro-satellite en orbite elliptique où le problème du pointage
stabilisé Terre est particulièrement difficile lors du passage au périgée.
Résultat d'une coopération à l'Ecole
de l'Air en 1993
: essentiellement Cdt Godard (automatique) + M Guiziou (mécanique spatiale et
rédaction), revu février 1999